搜索资源列表
FeatureSelection
- 一种对于文本的特征选择方法集合。对于txt数据,建立索引之后,提取其中词语的一些统计特性,包括tf,df,tf-idf,tv,tc等等,并将结果存储在数据库之中。-For txt data, index, the extract some of the words in the statistical properties, including tf, df, tf-idf, tv, tc, etc., and the results being stored in a database.
AnitVirus
- 基于Android杀毒软件 初学Android,此程序为毕设设计,仅作为学习使用,病毒库特征码保存在文本文件中,使用几个特殊字符分割,该文件保存在我临时网盘中,测试请自行更换URL,也可联系我获取病毒特征码提取程序-Android-based antivirus software beginner Android, this procedure is completed the set design, just as learning to use virus signatures stor
TFIDF-keywords
- 一种在考虑中文文本结构特征和中文语言词性特征的基础上,利用TFIDF公式的关键字提取算法-it uses the improved TFIDF formula to eatract keywords
Image-text-extraction
- 图形文字提取,根据特征把图片中的文字提取出来保存为文本。-Graphic text extraction, according to the characteristics of the text extracted the image to save as text.
scala-shell-code_09.scala
- 基于spark做的文本分类,有分词、提取TFIFDF关键词特征,贝叶斯分类次,word2vector-Make text classification based spark, partakers word feature extraction TFIFDF keyword, Bayesian classification times, word2vector
image-retrieval
- 最新的几篇图像检索方面的论文。在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括三方面:一方面对用户需求的分析和转化,形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;最后一方面是根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,按照相似度降序的方式输出。-The latest image retri several papers. On a retri principle,
caffe-master
- 种基于期望最大化( E M) 算法的局部图像特征的语义提取方法。首先提取图像的局部图像特 征, 统计特征在视觉词汇本中的出现频率, 将图像表示成词袋模型; 引入文本分析中的潜在语义分析技术建立从低层图像 特征到高层图像语义之间的映射模型; 然后利用 E M 算法拟合概率模型, 得到图像局部特征的潜在语义概率分布; 最后利 用该模型提取出的图像在潜在语义上的分布来进行图像分析和理解。-Semantic extraction of local image features based on expe
CEQA
- 功能:分词、特征词的提取、属性的提取、文本的分类等(Function: word segmentation, extraction of characteristic words, extraction of attributes, classification of text and so on)
ebookSpyder
- 小说类爬虫的集合,这类网页的特征是需要提取的文本特别多, 特别是中文,解析却相对简单,涉及的js较少 **思路**:爬目录页,解析各章节链接,爬各章节,解析,保存到txt里 大部分的小说当然不是自己看啦,主要拿来练习爬虫和做文本分析用(Novel collection of reptiles, the characteristics of such pages is the need to extract the text in particular, Especially in Chi
CBIR-system
- 随着计算机科技的发展,图像检索的应用也越来越成熟,根据检索性质可分为两类:基于文本的图像检索和基于内容的图像检索。本论文通过研究基于内容的图像检索中的几个核心算法,用于聚类分析的K-means算法,通过haar小波变换来提取图像底层视觉特征,以及使用F-范数理论来进行相似性度量,来设计一个离线的图像检索系统。(With the development of computer technology, the application of image retrieval is more and mo